31 research outputs found

    A Document Browsing Tool Based on Book Indexes

    Full text link
    This research project is a contribution to the global field of information retrieval, specifically, to develop tools to enable information access in digital documents. We recognize the need to provide the user with flexible access to the contents of large, potentially complex digital documents, with means other than a search function or a handful of metadata elements. The goal is to produce a text browsing tool offering a maximum of information based on a fairly superficial linguistic analysis. We are concerned with a type of extensive single-document indexing, and not indexing by a set of keywords (see Klement, 2002, for a clear distinction between the two). The desired browsing tool would not only give at a glance the main topics discussed in the document, but would also present relationships between these topics. It would also give direct access to the text (via hypertext links to specific passages). The present paper, after reviewing previous research on this and similar topics, discusses the methodology and the main characteristics of a prototype we have devised. Experimental results are presented, as well as an analysis of remaining hurdles and potential applications.CRSN

    Les traitements documentaires automatiques et le passage du temps

    Full text link
    Dans cet article, nous examinons le sort des documents qui ne sont pas destinés à vivre longtemps et qui ne méritent ainsi aucun traitement documentaire traditionnel. Nous défendrons la thèse que les traitements automatiques, bien que produisant des résultats de moindre qualité que les traitements humains, ont leur place pour le traitement de certains documents éphémères. Ils doivent cependant répondre à des normes de qualité qu’il faut définir de nouveau dans le contexte numérique

    Traitements documentaires automatiques et le passage du temps (Les)

    Get PDF
    Intervention au colloque "Le numérique : impact sur le cycle de vie du document", organisé à l\u27université de Montréal par l\u27EBSI et l\u27ENSSIB du 13 au 15 octobre 2004. Dans cet article est examiné le sort des documents qui ne sont pas destinés à vivre longtemps et qui ne méritent ainsi aucun traitement documentaire traditionnel. Il vise à montrer que les traitements automatiques, bien que produisant des résultats de moindre qualité que les traitements humains, ont leur place pour le traitement de certains documents éphémères. Ils doivent cependant répondre à des normes de qualité qu\u27il faut définir dans le contexte numérique

    Using Ancillary Text to Index Web-based Multimedia Objects

    Full text link
    PériCulture est le nom d'un projet de recherche à l'Université de Montréal qui fait partie d'un projet plus vaste basé à l'Université de Sherbrooke. Ce dernier visait à former un réseau de recherche pour la gestion du contenu culturel numérique canadien. L'objectif général de la recherche de PériCulture était d'étudier les méthodes d'indexation de contenus culturels non textuels sur le Web, plus spécifiquement des images. Les résultats de la recherche présentés ici s'appuient sur des travaux précédents en indexation d'images et en indexation automatique (de texte), par l'étude des propriétés du texte associé à des images dans un environnement réseau. Le but était de comprendre la façon dont le texte associé à des images sur des pages Web (appelé péritexte) peut être exploité pour indexer les images correspondantes. Nous avons étudié cette question dans le contexte de pages Web sélectionnées, c'est à dire : des pages de contenu culturel canadien contenant des objets multimédia auxquels était associé du texte (plus que simplement les noms de fichiers et les légendes) et qui étaient bilingues (anglais et français). Nous avons identifié les mots-clés utiles à l'indexation situés à proximité de l'objet décrit. Les termes d'indexation potentiels ont été identifiés dans diverses balises HTML et dans le texte intégral (chacun étant considéré comme une source différente de péritexte). Notre étude a révélé qu'un grand nombre de termes d'indexation utiles sont disponibles dans le péritexte de nombreux sites Web ayant un contenu culturel, et ce péritexte de différentes sources a une utilité variable dans la recherche d’information. Nos résultats suggèrent que ces termes peuvent être exploités de différentes manières dans les systèmes de recherche d’information pour améliorer les résultats de recherche.Réseau de recherche pour la gestion du contenu culturel numérique. (Responsable du réseau: Djemel Ziou, Université de Sherbrooke) (CoRIMedia). Subvention du Fonds des réseaux de recherche sur les nouveaux médias (Ministère du Patrimoine canadien

    Text Summarization by Sentence Extraction and Syntactic Pruning

    Full text link
    Nous présentons une méthode hybride pour le résumé de texte, en combinant l'extraction de phrases et l'élagage syntaxique des phrases extraites. L'élagage syntaxique est effectué sur la base d’une analyse complète des phrases selon un parseur de dépendances, analyse réalisée par la grammaire développée au sein d'un logiciel commercial de correction grammaticale, le Correcteur 101. Des sous-arbres de l'analyse syntaxique sont supprimés quand ils sont identifiés par les relations ciblées. L'analyse est réalisée sur un corpus de divers textes. Le taux de réduction des phrases extraites est d’en moyenne environ 74%, tout en conservant la grammaticalité ou la lisibilité dans une proportion de plus de 64%. Étant donné ces premiers résultats sur un ensemble limité de relations syntaxiques, cela laisse entrevoir des possibilités pour une application de résumé automatique de texte.CRSN

    Interprétation linguistique et computationnelle des valeurs par défaut dans le domaine syntaxique

    Full text link
    Thèse diffusée initialement dans le cadre d'un projet pilote des Presses de l'Université de Montréal/Centre d'édition numérique UdeM (1997-2008) avec l'autorisation de l'auteur

    Gestion des données de recherche en milieu collégial : Réflexions sur la mise en place de services par les bibliothèques

    Get PDF
    Comprend des références bibliographiques.Communication orale dans la cadre du Congrès des professionnels de l’information, Centre Mont-Royal, Montréal, 30 octobre 2019

    Les pratiques pédagogiques exemplaires en sciences de l\u27information : 15 fiches annotées

    Get PDF
    Travail mené dans le cadre d\u27un projet de portail de ressources pédagogiques à l\u27EBSI

    Les pratiques pédagogiques exemplaires en sciences de l'information : 21 fiches annotées

    Get PDF
    Ce rapport constitue une version augmentée d’un premier rapport datant d’août 2005. Les 21 fiches annotées peuvent aussi être consultées individuellement (en format HTML) à partir du « Portail des ressources pédagogiques et disciplinaires en sciences de l'information » accessible à l’adresse : http://www.ebsi.umontreal.ca/clip/Ce rapport présente les résultats de projets d'intégration pédagogique réalisés dans le cadre du Comité local d'intégration pédagogique (CLIP) de l'École de bibliothéconomie et des sciences de l'information (EBSI) de l'Université de Montréal. Cet inventaire des pratiques pédagogiques exemplaires (best practices) en sciences de l'information (SI) fait partie du projet « Banque de ressources pédagogiques en sciences de l'information » ayant pour but la constitution d’un portail mettant à la disposition des enseignants en SI une variété de ressources pédagogiques actuellement dispersées et donc difficilement exploitables. La première partie de ce document présente un état de la question sur les pratiques pédagogiques exemplaires en SI, réalisé à partir des deux composantes suivantes : une revue de littérature sur les pratiques pédagogiques en SI, et une enquête menée auprès des enseignants de l’EBSI. La seconde partie du document est constituée de 21 fiches annotées sur les pratiques pédagogiques exemplaires en SI.Comité universitaire d'intégration pédagogique de l'Université de Montréal

    From the ground up: Building a roadmap of research priorities for a national research data management community

    Get PDF
    Presented at RDAP2019: Building Communities, May 15-17, 2019. (Research Data Access and Preservation Summit)Launched in 2015, the Canadian Association of Research Libraries (CARL) Portage Network is dedicated to the shared stewardship of research data in Canada through fostering national communities of practice for research data, and building national research data services and infrastructure. Portage has developed a large network of expertise comprised of Expert Groups, each with mandates related to specific areas of research data management (RDM). The objective of the Research Intelligence Expert Group (RIEG) is to provide the Portage Network with research intelligence on the state of RDM in Canada for a variety of related topics through the development and oversight of targeted studies designed to gather supporting evidence. In order to set research priorities for RIEG, a high-level roadmap was developed to bridge gaps in our knowledge about RDM practices, developments, communities, and policies in Canada. To understand the existing landscape, an environmental scan was conducted, guided by a custom taxonomy developed by RIEG. Topics including data curation, data sharing and reuse, services, policy and law, and information technology were examined from an international and Canadian context to determine gaps and priority areas. This poster will offer an overview of the development of this roadmap, detailing how it helped to formalize recommendations for action, prioritize research tasks, and set objectives for RIEG and the Portage Network moving forward
    corecore